SPSS操作:配对样本的差值不符合正态分布,咋统计分析?
一、问题与数据
当一组配对样本的数据中差值d服从正态分布时,我们可以选用配对样本t检验的方法进行统计检验,具体方法参见文章“配对样本的t检验”。但是,如果差值d不符合正态分布时,我们该如何处理呢?
医咖会在“非正态分布的数据,怎么统计分析?”一文中,介绍了非参数检验的基本方法。我们知道有些数据并不符合参数检验的要求,最常见的情况是总体不符合正态分布,这时我们就可以使用非参数检验的方法。同样,如果配对样本的差值不符合正态分布,那我们将使用配对样本的秩和检验进行数据分析。
我们来举个例子,为研究先后出生的孪生兄弟间智力是否存在差异,对12对孪生兄弟的智力进行测试,结果见下表:
二、对数据结构的分析
上述数据为12对孪生兄弟之间的智力得分,需要判断每对孪生兄弟之间的智力得分差异,测量指标为智力得分,属于配对设计的定量资料。对孪生兄弟之间的智力得分差值进行正态性检验,可以发现智力得分的差值不符合正态分布,因此本数据选用配对样本的秩和检验。
三、SPSS分析方法
1. 将数据录入SPSS
2. 在操作框中选择Analyze—Nonparametric Test——Legacy Dialogs--2 Related Samples
3. 选项设置
对话框设置:将“先出生”和“后出生”两个智力评分数值变量放入Test Pairs框中的Variable 1和Variable 2(Pair 1)中,Test Type选择Wilcoxon,点击OK按钮,即可得出检验结果。
四、结果解读
结果中报告了每对孪生兄弟智力得分差值的秩的情况,有7对孪生兄弟中,后出生的智力评分低于先出生的,平均秩为5.93,秩的和为41.5;有4对孪生兄弟中后出生的智力评分高于先出生的,平均秩为6.13,秩的和为24.5;有1对孪生兄弟的智力评分相同。
Wilcoxon Signed Ranks Test的结果表明Z值为-0.756,近似法计算的P值(双侧)为0.449>0.05,差异无统计学意义。
五、撰写结论
在孪生兄弟中先出生的智力得分中位数为74.5分,平均值为79分;后出生的智力得分中位数为74分,平均值为77分;采用Wilcoxon符号秩检验:Z=-0.756,P=0.449,尚不能认为孪生兄弟中的出生顺序与智力发育有关。
六、延伸阅读
Wilcoxon Signed Ranks Test即Wilcoxon符号秩检验,对配对资料的差值采用符号秩方法来检验。此方法既考虑了正、负号,又利用了差值大小,所以效率要比符号检验法高。
它的具体原理如下表:
首先,我们求出后出生者的智力得分(M2)与先出生者的智力得分(M1)的差值d=M2-M1,对智力得分的差值(d)进行排秩次(R),若差值为0则不排秩次,差值不为0的按照绝对值的大小进行排序(从1至n),注意有相同的差值的秩次要取平均数。由表中计算可得差值为正数的秩次之和(T+)为3+7+5.5+9=24.5;差值为负数的秩次(T-)为1.5+4+10+1.5+5.5+8+11=41.5。
本例子的检验假设:
H0:孪生兄弟的智力得分是相同的。
H1:孪生兄弟的智力得分是不同的。
本例中因有一对孪生兄弟的智商得分相同,因此只将11个智力评分差值排列秩次,按照排列规则,所有的秩次之和应为(1+2+…+n)=n(n+1)/2=T++T-。
如果原假设为真,那么T+与T-应该有相同的值,即n(n+1)/4,构造Wilcoxon符号秩的统计量S=T+-n(n+1)/4,因此S值大于或者小于临界值,我们就可以拒绝原假设。在实际工作中为便于计算直接选取秩和的最小值即W=min(T+,T-)。根据查表显著水平α=0.05,n=11时双侧检验的临界值为14,即W值得拒绝区域为0至14,本例中W=24.5>14,因此不能拒绝原假设。
后续我们还将推出:多个独立样本的秩和检验以及非参数检验后的两两比较,敬请期待~~
(如果你想使用文中数据进行练习,请随时给小咖(微信:xys2016ykf)发消息,小咖将原始数据发给你。)
统计学教程精彩回顾:
关注医咖会,一起学习统计学~
我们建了一个微信群,有临床研究设计或统计学方面的难题?快加小咖个人微信(xys2016ykf),拉你进群和其他小伙伴们一起交流学习。诚邀各位伙伴加入我们创作内容,请和小咖联系,和大家分享你喜爱的临床研究以及有用的研究方法学知识。
点击左下角“阅读原文”,看看医咖会既往推送了哪些研究设计或统计学文章。还可以到医咖会公众号下方的自定义菜单,点击“直接搜索”,查找你想了解的内容。